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1 Modele obliczeń, czas obliczeń 


Przypuśćmy, że chcemy coś obliczyć i zastanawiamy się, ile nam to zajmie czasu. Aby 
rozważać takie kwestie, musimy wiedzieć, w jaki sposób definiujemy obliczenia i jak je 
realizujemy, czyli wyobrazić sobie pewien tzw. model obliczeń. Przykładami takich mo- 
deli mogą być maszyny RAM i schematy blokowe. Kolejne przykłady i dokładniejsze 
wyjaśnienia znajdą się dalszej części tego tekstu. 

Aby przeprowadzić konkretne obliczenia musimy także wiedzieć, jak wyliczyć inte- 
resującą nas wartość posługując się naszym modelem obliczeń. Musimy więc znać jakiś 
sposób postępowania, program lub schemat obliczeń, coś co definiuje konkretne oblicze- 
nia. Dalej taki sposób postępowania będziemy określać słowem algorytm. Dla naszych 
potrzeb przez chwilę będziemy posługiwać się pewnym algorytmem A. 

Algorytm 4, jak każdy algorytm, wymaga danych. Niech D oznacza zbiór wszystkich 
możliwych danych lub danych dla algorytmu A. Mając algorytm i dane możemy już 
przeprowadzić obliczenia i sprawdzić, ile zajmują czasu. 

Dokładny czas obliczeń zbytnio nas nie interesuje. Bardziej istotne jest to, czy jesteśmy 
w stanie uzyskać wynik obliczeń w sensownym terminie, a więc raczej chcemy przewidzieć 
czas obliczeń lub jakoś go ocenić. W tym celu trochę upraszczamy sytuację: w obliczeniach 
wyróżniamy czynności elementarne, dla każdej takiej czynności określamy liczbę jednostek 
czasu potrzebną do jej wykonania (bardzo często uznajemy, że trwa jedną jednostkę 
czasu), w końcu sprawdzamy, jakie czynności elementarne musimy wykonywać i sumujemy 
ich czasy wykonania. 

W ten sposób dla danego algorytmu A i danych z € D znajdujemy pewną liczbę t4(z), 
która w pewnym stopniu oddaje czas wykonania algorytmu A dla danej z. Tym samym 
określiliśmy pewną funkcję tą : D * N przyporządkowującą elementom zbioru D odpo- 
wiednie liczby naturalne. Wartość t4(x) będziemy nazywać czasem wykonania algorytmu 
A uruchomionego z daną z. Na razie ta wartość nie została precyzyjnie zdefiniowana, ale 
będziemy się nią (także funkcją t4) przez chwilę posługiwać bez szczegółowej definicji. 

W teorii złożoności obliczeniowej oprócz czasu obliczeń analizuje się wielkość pamięci 
ma(x) niezbędnej do wykonania algorytmu A dla danej z, możemy analizować liczbę 
kartek niezbędnych do pisemnego przeprowadzenia obliczeń, a także inne wielkości. 


2 Rozmiar danych 


Przyglądając się algorytmowi pisemnego dodawania możemy zauważyć, że liczba czynno- 
ści wykonywanych podczas obliczeń w niewielkim stopniu zależy od wartości dodawanych 
liczb, a dla liczb o równie długich przedstawieniach jest zbliżona. 

Podobnie jest, gdy używając komputera porządkujemy ciąg wartości typu int: czas 
porównywania dowolnych dwóch wartości tego typu jest taki sam, a czas wykonania 


zadania nie zależy od danych wartości. W pierwszym rzędzie zależy od długości danego 
ciągu. Sytuacja zmieni się jednak, gdy zamiast liczb będziemy porządkować słowa. Można 
spodziewać się, że porządkowanie dłuższych słów zajmie więcej czasu. 

Rozmiar danej to taka liczba naturalna, która dość dobrze wyznacza czas działania 
algorytmu dla rozważanej danej. Trudno to zdanie uznać za definicję rozmiaru. Raczej 
oddaje intencje, które nam przyświecają, gdy wprowadzamy to pojęcie. W przypadku 
dodawania rozmiarem danych może być maksimum długości przedstawień danych liczb, 
czyli liczba cyfr potrzebna do zapisania większej z dodawanych liczb. Dla zadania sorto- 
wania rozmiarem danych może być długość danego ciągu. Widać też, że trudno będzie 
znaleźć ogólną definicję rozmiaru, zadawalającą nas we wszystkich przypadkach. Mimo 
to o tym pojęciu można już trochę powiedzieć, i to bez znajomości precyzyjnej definicji. 

Rozmiarem danej zawsze będzie liczba naturalna. Dla liczby naturalnej n możemy 
rozważać zbiór D, danych o rozmiarze n, co więcej, takie dane powinny istnieć. Oczy- 
wiście, każda dana rozmiaru n jest jedną z możliwych danych. Z drugiej strony, każda 
dana powinna być daną pewnego rozmiaru. Trudno będzie nam wyobrazić sobie dane, 
które są jednocześnie rozmiaru n i m dla dwóch różnych liczb naturalnych n i m. Byłoby 
bardzo dobrze, gdyby danych ustalonego rozmiaru było skończenie wiele. Ten warunek 
jednak czasem nie jest spełniony. Na przykład w przypadku zadania sortowania. Jednak 
w tym przypadku dla danych rozmiaru n algorytmy działaja na n! sposobów, w najwyżej 
n! różnych czasach. 

Na razie będziemy próbować wykorzystać to pojęcie bez podawania dokładnej defini- 
cji. 


3 Złożoność obliczeniowa 


Znając czasy wykonywania algorytmu A dla poszczególnych danych i rozmiary danych 
określamy złożoność czasową algorytmu A. Jest to funkcja cą : N —> N zdefiniowana 
wzorem 

cą(n) = maxfta(z): z € Dn} 


(przypomnijmy, że D, to zbiór danych rozmiaru n). Poprawność definicji wymaga istnie- 
nia występującego w niej maksimum, definicja jest poprawna na przykład, gdy zbiory D, 
są skończone. W ten sposób z każdym algorytmem wiążemy pewną funkcję, a więc jed- 
nolicie zdefiniowany parametr, pozwalający porównywać różne algorytmy i oceniać czas 
ich wykonania. 

W analogiczny sposób definiuje się inne rodzaje złożoności, na przykład złożoność 
pamięciową. 

Złożoność definiowaną w podany sposób określa się jako pesymistyczną lub najgorsze- 
go przypadku. Bywa też rozważana tzw. średnia złożoność, która (w przypadku złożoności 
czasowej) jest definiowana wzorem 


= Ź SEDĘ tA (x) 
liczba elementów zbioru D, 


saln) 


Wartość c4(n) jest zwykle trudna do precyzyjnego wyliczenia, a jeżeli już uda nam się 
dokładnie wyznaczyć funkcję c4, to otrzymany wzór jest „nieładny” i trudny do analizo- 
wania metodami matematycznymi. W związku z tym ocena złożoności algorytmu odbywa 
się w sposób bardzo uproszony, zgodny z dwiema — niekoniecznie słusznymi — opiniami 
sformułowanymi przed wieloma laty. 


Uważa się na przykład, że dwa algorytmy o złożoności wyrażanej odpowiednio funkcją 
f i dwa razy większą funkcją 2f nie różnią się istotnie: jeżeli jesteśmy gotowi czekać na 
wynik obliczeń f(n) jednostek czasu, to po upływie roku lub dwóch, w wyniku postępu 
technicznego, w tym samym, akceptowalnym dla nas czasie przypuszczalnie zrealizujemy 
obliczenia wymagające dwa razy większej liczby operacji. 

Podobnie, nie trzeba sobie zaprzątać głowy pojedyńczymi danymi, dla których algo- 
rytm działa wyjątkowo długo. Bez trudu zmieniamy działanie algorytmu dla skończenie 
wielu danych. Przed przystąpieniem do wykonania właściwego algorytmu zmieniony al- 
gorytm sprawdza, jakie otrzymał dane, a jeżeli otrzymał te wyjątkowe, to po prostu 
podaje odpowiedź wyliczoną na przykład na kartce przez programistę. Dopiero później 
uruchamia zaplanowane obliczenia. W ten sposób kosztem dodatkowego czytania danych 
uzyskujemy algorytm, który dla wybranych danych nic nie liczy i przez to działa w naj- 
krótszym możliwym czasie (można się bowiem spodziewać, że każdy algorytm zapoznaje 
się z danymi i wyświetla wyniki obliczeń). 


3.1 Relacja O duże 


Do porównywania algorytmów, a właściwie ich złożoności, stosuje się tzw. relację O duże 
wykorzystywaną przez matematyków do porównywania tempa wzrostu funkcji. Mówimy, 
że funkcja naturalna g jest O duże od f i piszemy! g(n) =O(f(n)), jeżeli 


Je > 0 3no Yn > no gln) <c- f(n). 


Do sprawdzenia, czy zachodzi relacja O duże możemy posłużyć się granicami. Łatwo 
dowodzi się, że jeżeli funkcje f i g przyjmują wartości dodatnie i 
. g(n) 
lim —— 
nace f(n) 
Łatwo też podać przykłady, że implikacja odwrotna nie jest prawdziwa. Tak jest na 
przykład dla funkcji zdefiniowanych wzorami 


istnieje (jest skończona), to g(n) = O(f(n)). 


_ | n gdy n jest liczbą parzystą LŚ 
g(n) = 2” w przeciwnym razie oraz f(n) = 9" 


Dla tych funkcji iloraz g(n)/f(n) przyjmuje na przemian wartości 1 i coraz bliższe 0, a 
więc granica tego ilorazu nie istnieje. Tym niemniej funkcja g jest O duże od f i jest to 
właściwie oczywiste. 

O funkcjach g i f mówimy, że są tego samego rzędu, jeżeli g = O(f) i jednocześnie 
f =O(g). Jeżeli funkcje f i g przyjmują wartości dodatnie i jeżeli udało nam się pokazać, 
że iloraz tych funkcji dąży do dodatniej granicy, to funkcje te są tego samego rzędu. 


TWspółcześnie myślimy o funkcjach na dwa sposoby. Pojęcie to może być rozumiane klasycznie, jako 
pewien wzór na przykład ze zmienną n, pozwalający dla danej liczby a wyliczyć wartość funkcji dla 
argumentu a (podstawiamy we wzorze liczbę a zamiast n i wykonujemy opisane nim obliczenia). Wtedy 
piszemy f(n) = O(g(n)), a napisy f(n) oraz g(n) rozumiemy jako pewne wzory, na przykład n? = 
O(2n + 3). Tutaj n? jest wzorem definiującym operację podnoszenia do kwadratu, a nie kwadratem 
pewnej liczby n. Takie podejście powoduje, że czasem trudno jest nam odróżnić wzór n? od kwadratu 
liczby n. 

W matematyce opartej na teorii mnogości funkcje rozumiemy jako relacje lub przyporządkowania i nie 
musimy definiować ich wzorami, a nawet niektórych nie jesteśmy w stanie tak zdefiniować. Mając dwie 
funkcje naturalne f i g możemy napisać f = O(g). Jest to bardziej logiczne (relacja O duże zależy tylko 
od funkcji), ale ma też wadę: dotychczas nie zostały wymyślone żadne symbole oznaczające podstawowe 
funkcje (na przykład podnoszenie do kwadratu), a napisy w rodzaju sin = O(4 ) raczej zostaną uznane 
za niepoprawne (znak y nie jest uważamy za symbol oznaczający funkcję). 


3.2 Relacja O duże w teorii złożoności 


Przypuśćmy, że mamy algorytm A. Wiemy już, co to jest jego (czasowa) złożoność ob- 
liczeniowa cą. Posługujemy się też ogólniejszym pojęciem złożoności: mówimy, że A jest 
algorytmem o złożoności czasowej f, jeżeli cą = O(f). 

Jak widać mamy dwa, bardzo podobne (podobnie nazywane i definiowane) pojęcia. 
Pierwsze definiuje ściśle określoną funkcję, drugie ocenia tę funkcję za pomocą innych, 
niemalże dowolnych. Opisuje więc związek między algorytmem i pewną funkcją. 

Czasem mówimy, że A jest algorytmem liniowym, jeżeli cą(n) = O(n); kwadratowym, 
jeżeli cą(n) = O(n?); wielomianowym, jeżeli cą(n) = O(n*) dla pewnego k € N. 

Pojęcie algorytmu o złożoności f może być stosowane w sposób niewłaściwy. Je- 
żeli na przykład udało nam się pokazać, że złożoność algorytmu A jest dana wzorem 
ca(n) = 3n? + Tn + 13, to zgodnie z przytoczoną definicją, możemy powiedzieć, że jest to 
algorytm o złożoności 5 : 27*”. Prawdą będzie również, że jest to algorytm o złożoności 
n*/1234. Tego typu stwierdzenia jednak nie powinny się pojawiać, a zawarta w definicji 
znaczna dowolność w wyborze funkcji nie powinna być nadużywana. Najlepiej powiedzieć, 
że jest to algorytm o złożoności n? (czyli kwadratowy). Mówiąc o złożoności algorytmu 
powinniśmy dążyć do wskazania rzędu funkcji wyrażającej złożoność, choć też nie budzi 
zastrzeżeń stwierdzenie o algorytmie kwadratowym, że udało się nam tylko pokazać, że 


jest to algorytm o złożoności n*. 


3.3 Ważne uwagi 


Pojęcia związane ze złożonością obliczeniową mają bardzo skomplikowane i długie defini- 
cje, w których roi się od różnorodnych szczegółów. Zależą od wielu pojęć, w tym od modeli 
obliczeń, rozmiaru danych, operacji uznanych za elementarne, i wielu innych drobiazgów. 
Szczególnie duży wpływ na definicję złożoności ma lista czynności, które mogą być wy- 
konywane w wykorzystywanym modelu obliczeń. Na przykład maszyny RAM mogą się 
różnić wykazem instrukcji arytmetycznych wykonywanych przez maszynę: mogą doda- 
wać i mnożyć, albo tylko dodawać, a mogą nawet tylko dodawać liczbę 1. W przypadku 
schematów blokowych jest istotne, jakie podstawienia i jakie testy możemy umieszczać w 
odpowiednich polach schematu. Wiele kontrowersji budzi też definicja rozmiaru danych 
będących na przykład liczbami naturalnymi. 

Wszystkie elementy w definicji złożoności można, rzecz jasna, uściślać na wiele sposo- 
bów. Trzeba zdawać sobie sprawę z tego, że prowadzi to do wielu definicji, niekoniecznie 
równoważnych. Powoduje to, że zwroty w rodzaju algorytm o złożoności wielomianowej 
są niejasne. 

Zdefiniowane jakkolwiek pojęcia złożoności, jeżeli tylko dobrze pasują do treści zada- 
nia, można z powodzeniem wykorzystać do porównania i oceny studenckich rozwiązań 
tego samego zadania. Swobodnie wykorzystuje się je również do analizy algorytmów roz- 
wiązujących określonymi metodami pewien konkretny problem, dobierając specyficzną 
definicję do rozważanego problemu. 

Informatycy wykorzystują pojęcie złożoności także do klasyfikacji problemów, mówiąc 
intuicyjnie, do podzielenia problemów na łatwe do rozwiązania (obliczania) i trudne. 
Wtedy zdarza się, że porównujemy dwa, właściwie dowolne algorytmy. Powoduje to, że 
musimy korzystać tylko z uzgodnionych definicji lub definicji im równoważnych i nie 
możemy ich swobodnie dostosowywać do sytuacji. W szczególności, w takim właśnie 
sensie na ogół mówimy np. o złożoności wielomianowej. 


4 Przykład modelu obliczeń: maszyny Turinga 


Pierwszym modelem obliczeń były maszyny Turinga. Powstały nie po to, by przeprowa- 
dzać na nich obliczenia, w pierwszym rzędzie służyły do podzielenia wszystkich funkcji 
na te, które można obliczać, i pozostałe. Dzięki tym maszynom i precyzyjnej definicji 
obliczalności dowiedliśmy, że nie jesteśmy w stanie obliczać wartości wielu interesujących 
funkcji. 

Maszyny Turinga powstały w wyniku analizy sposobu prowadzenia pisemnych ra- 
chunków, na przykład dodawania liczb na kartce papieru. Mimo to posługują się taśmą 
podzieloną na komórki, ustawione tak, jak liczby całkowite (na taśmie każda komórka 
ma dwie sąsiednie, po jednej z lewej i z prawej strony). W każdej komórce może być 
zapisany jeden znak. Maszyna Turinga jest także wyposażona w głowicę: znajduje się 
ona w pewnym stanie i obserwuje pojedyńczą komórkę taśmy. Ostatnim elementem ma- 
szyny Turinga jest program, który definiuje sposób działania maszyny. Jest to zbiór (!) 
rozkazów. 

Każdy rozkaz jest wykonywany w ściśle określonej sytuacji: gdy maszyna znajduje 
się w określonym stanie i widzi na taśmie określony znak. Wykonanie rozkazu polega na 
zastąpieniu obserwowanego znaku innym, wskazanym w rozkazie, odpowiedniej zmianie 
stanu głowicy i przesunięciu jej w lewo lub w prawo, nad sąsiednią komórkę, podaną w 
rozkazie. Po uruchomieniu maszyna przegląda swój program w celu znalezienia dającego 
się wykonać rozkazu (może takiego nie być), wykonuje znaleziony rozkaz i robi to tak 
długo, aż okaże się, że w programie nie ma rozkazu, który można wykonać (program się 
nie zmienia, poszczególne rozkazy są wykonywane wielokrotnie). 

Maszyny Turinga są wykorzytywane do różnych celów. Umówmy będą nam służyć do 
obliczania wartości jednoargumentowych funkcji naturalnych (określonych i przyjmują- 
cych wartości w zbiorze liczb naturalnych). Jeżeli chcemy obliczyć wartość pewnej funkcji 
dla argumentu n, to bierzemy odpowiednią maszynę Turinga i czystą taśmę, na taśmie 
zapisujemy przedstawienie liczby n, ustawiamy głowicę maszyny nad pierwszą zapisaną 
komórką i uruchamiamy maszynę. Po zakończeniu pracy maszyny z taśmy odczytujemy 
słowo, którego litera jest obserwowana przez głowicę (słowo to jest ciągiem znaków (cyfr) 
zapisanych w spójnym fragmencie taśmy ograniczonym pustymi komórkami). Odczytane 
słowo jest przedstawieniem wartości obliczanej funkcji dla argumentu n. 

Maszyny Turinga służyły również do zdefiniowania pojęcia algorytmu: algorytm (for- 
malnie) to nic innego, jak program dla maszyny Turinga. Niech więc A będzie algorytmem, 
czyli maszyną Turinga, ewentualnie programem dla maszyny Turinga. Czas wykonania 
tego algorytmu dla danej n jest dany wzorem 


ta(n) = liczba rozkazów wykonanych przez A z zapisanym na taśmie przedst. liczby n 


(dokładniej: czas wykonania algorytmu A (czas pracy maszyny 4) to liczba rozkazów 
wykonanych po uruchomieniu A z poprawnie zapisaną daną od momentu włączenia ma- 
szyny aż do zatrzymania się maszyny, dla niektórych algorytmów i danych liczba ta może 
nie być określona). 

Dla maszyn Turinga jest rzeczą naturalną by przyjąć, że rozmiar danej to liczba zna- 
ków zapisanych na taśmie, czyli długość przedstawienia liczby n (w ustalonym systemie 
liczbowym, którym się posługujemy). 

Tego typu model i wprowadzone tutaj pojęcie złożoności sprawdza się w bardzo ogól- 
nych przypadkach. Na przykład, gdy narzuciliśmy sobie jakieś ograniczenie f na złożoność 
algorytmu i zastanawiamy się, czy są jakieś problemy, których nie można rozwiązać za 


pomocą algorytmów o złożoności f. Albo, czy są problemy, które można rozwiązać za 
pomocą algorytmu o złożoności g, a nie można ich rozwiązać za pomocą algorytmów o 
złożoności f? Albo też, jak dużą funkcję g trzeba wziąć, aby istniał problem, który moż- 
na rozwiązać za pomocą algorytmu o złożoności g, a nie można go rozwiązać za pomocą 
żadnego algorytmu o złożoności f? 


5 Maszyny RAM i złożoność 


Rozważamy wiele wersji maszyn RAM i są one wykorzystywane do różnych celów. Mogą 
służyć do analizowania, prezentowania a nawet prowadzenia obliczeń na liczbach natu- 
ralnych lub całkowitych. Czasem zakłada się, że liczą na liczbach rzeczywistych (a więc 
rozkaz ADD oznacza dodawanie liczb rzeczywistych) a nawet na jakiś abstrakcyjnych war- 
tościach. Bywa, że wśród rozkazów mają polecenia pozwalające mnożyć i dzielić, zwykle 
mają tylko pozwalające dodawać i odejmować, podobnie jak procesory starszych typów. 

Podobnie, jak maszyny Turinga, mogą być wykorzystane do opisu klasy funkcji da- 
jących się obliczać. Jeżeli przyjmiemy, że maszyny RAM, tak jak maszyny Turinga, wy- 
korzystujemy do obliczania wartości jednoargumentowych funkcji naturalnych lub cał- 
kowitych, to możemy przyjąć także analogiczne definicje rozmiaru danych (rozmiar to 
wielkość przedstawienia danej liczby) i złożoności obliczeń (np. zliczamy liczbę instrukcji 
maszyny RAM wykonywanych podczas obliczeń). 


6 Sortowanie 


Sortowanie jest bardzo często wykonywane przez komputery. Algorytmy sortujące były 
wszechstronnie badane, była także analizowana ich złożoność. Takie algorytmy jako dane 
zwykle dostają tablicę jakiś wartości a[0|, a|1],...,a|n— 1], dane te porównują (sprawdza- 
ją, czy ali] < alj]) i przestawiają (wykonują procedurę x — ali); ali] — alj]; a|j| — x). 
Celem jest takie poprzestawianie danych, aby w tablicy a znajdowały się w ustalonym 
porządku. Zakłada się przy tym, że dane są tylko porównywane i przestawiane, i nie są 
badane ani modyfikowane w żaden inny sposób. 

Jeżeli zajmujemy się sortowaniem, to czasem ograniczamy się do takich właśnie al- 
gorytmów. Wtedy nie posługujemy się ogólnym pojęciem złożoności, tylko szczególnym, 
dostosowanym do rozważanego problemu. Możemy przyjąć, że rozmiar danych to liczba 
elementów sortowanej tablicy. Model obliczeń powinien umożliwiać korzystanie z algo- 
rytmów wykonujących porównania i przestawienia. Mogą nim być maszyny RAM lub 
schematy blokowe. Maszyny Turinga raczej nie będą dobrym rozwiązaniem. Przyjmuje 
się, że czas wykonania algorytmu jest proporcjonalny do liczby wykonanych porównań i 
przestawień. 


7T Mnożenie macierzy 


Kolejnym, bardzo specyficznym pojęciem złożoności posługują się naukowcy zajmujący 
się algorytmami mnożenia macierzy. Jest to dość ważne zagadnienie. Wiąże się z tzw. 
geometrią obliczeniową, w której na przykład obliczamy odległość punktu od bryły prze- 
strzennej (być może w przestrzeni o dużej liczbie wymiarów), albo wyznaczamy najkrótszy 
odcinek łączący punkt z daną bryłą, także z grafiką komputerową i innymi problemami. 


Takie zagadnienia wymagają rozwiązywania układów równań liniowych, a rozwiązy- 
wanie takich układów jest algorytmicznie równoważne z zadaniem mnożenia macierzy: im 
sprawniej potrafimy mnożyć macierze, tym sprawniej potrafimy rozwiązywać równania 
liniowe i na odwrót. 

Macierze to dwuwymiarowe tablice, których elementami są jakieś liczby. Każda taka 
tablica ma pewną liczbę wierszy i kolumn. Jeżeli analizujemy algorytmy wymagające 
macierzy jako danych, to możemy przyjąć, że rozmiarem jest maksimum z liczby wierszy i 
kolumn danej tablicy. W przypadku algorytmów rozwiązujących układy równań liniowych 
daną może być tablica współczynników układu, a rozmiarem danej — liczba zmiennych 
układu. 

Iloczynem dwóch macierzy o n wierszach i n kolunmach jest macierz o takich samych 
wymiarach. Aby wyliczyć element iloczynu znajdujący się w i-tym wierszu i j-tej kolumnie 
bierzemy dwa ciągi liczb: i-ty wiersz pierwszego czynnika oraz j-tą kolumnę drugiego, 
kolejne wyrazy tych ciągów mnożymy przez siebie, a następnie dodajemy wszystkie tak 
otrzymane iloczyny. Naturalny algorytm mnożenia macierzy wylicza więc wiele iloczynów 
i sumuje odpowiednie liczby. Zgodnie z tym algorytmem wyliczenie elementu macierzy 
wynikowej dla macierzy wymiaru n x n wymaga wykonania n mnożeń i n — 1 dodawań, 
a całego iloczynu — nê mnożeń i n* — n? dodawań, a więc wymaga wykonania 2n* — n? 
operacji arytmetycznych. 

Badacze zajmujący się mnożeniem macierzy posługują specyficznym pojęciem zło- 
żoności obliczeniowej, silnie dostosowanym do tego zagadnienia. Zwykle przyjmują, że 
rozmiarem macierzy kwadratowej o wymiarach n x n jest liczba n. Tak więc określenie 
danej rozmiaru n w tym przypadku wymaga wskazania n? liczb. 

Rzeczą naturalną jest przyjąć, że czas działania algorytmu mnożenia macierzy jest 
proporcjonalny do liczby operacji arytmetycznych wykonywanych na elementach macie- 
rzy. Okazuje się jednak, że dla szerokiej klasy takich algorytmów liczba wykonywanych 
dodawań nie przekracza pewnej wielokrotności liczby mnożeń. Tak więc można uznać, 
że czas wykonania algorytmu mnożenia macierzy jest proporcjonalny do liczby wykony- 
wanych mnożeń. W tej sytuacji złożoność takiego algorytmu określa się po prostu jako 
liczbę mnożeń wykonywanych podczas realizacji algorytmu. 

Taka definicja złożoności jest, rzecz jasna, kontrowersyjna i sprawdza się jedynie wte- 
dy, gdy jest stosowana do wąskiej klasy algorytmów mnożenia macierzy. 


8 Problemy wielomianowe 


Nie tak dawno temu ważną rolę odgrywały wielomianowe problemy (obliczenia, algoryt- 
my itp.), a więc takie, których złożoność obliczeniowa była O(n*) dla pewnej liczby k. 
Uważano, że są to problemy, które można praktycznie (w rzeczywistości) rozwiązywać za 
pomocą komputerów w przeciwieństwie do innych, które co prawda można rozwiązywać 
w sposób zalgorytmizowany, ale ze względu na złożoność obliczeń nie jest to możliwe w 
sensownym czasie. Klasę takich problemów zwykle oznacza się symbolem P. 

Tak sformułowana definicja klasy P zależy jeszcze od użytego w niej modelu obliczeń 
i to istotnie, choć nie do końca. Definicja prawdziwej klasy P na ogół używa maszyn 
Turinga. Jeżeli w definicji posłużymy się maszyny RAM, to otrzymamy różne klasy w 
zależności od listy rozkazów wykonywanych przez maszynę. Jeżeli maszyna nie potrafi 
wykonywać rozkazów mnożenia i dzielenia (potrafi tylko dodawać i odejmować, podob- 
nie jak starsze procesory), to niezależnie od użytego modelu obliczeń w podany sposób 


definiujemy tę samą klasę i jest to klasa P. 
Maszyna RAM z mnożeniem potrafi wykonać następujący program 


1) mamy daną liczbę naturalną n; 


2 


m = 2; 


4 


) 
) 

3) dopóki n > 0 wykonuj 
) m=e<m*m,;, n=n/2; 
) 


5 


wypisz m. 


Jest to program wielomianowy (nawet liniowy), pętla dopóki jest w nim wykonywana tyle 
razy, ile wynosi rozmiar r danej n. Oblicza on wartość m, której rozmiar jest wykładniczy 
(~ 27). Wypisanie jej przedstawienia wymaga więc wykładniczego czasu. 

Jest oczywiste, że takiego algorytmu nie da się zrealizować na wielomianowej maszynie 
Turinga (musi ona napisać całe przedstawienie wyniku obliczeń). 

Maszyna RAM z mnożeniem jest jednak bardzo wygodnym modelem obliczeń, jest 
więc wykorzystywana. Co więcej, klasę P problemów wielomianowych można opisać po- 
sługując się takimi maszynami. Należą do niej te problemy, które można rozwiązać za 
pomocą wielomianowych maszyn RAM z mnożeniem, które spełniają dodatkowy waru- 
nek: podczas obliczeń pojawiają się jedynie wartości o wielomianowo dużym rozmiarze 
(o rozmiarze ograniczynym przez pewiem wielomian zależny od rozmiaru danych). Oczy- 
wiście, przytoczony wyżej program nie spełnia ostatniego warunku. 


